36 research outputs found

    Bi-class classification of humpback whale sound units against complex background noise with Deep Convolution Neural Network

    Full text link
    Automatically detecting sound units of humpback whales in complex time-varying background noises is a current challenge for scientists. In this paper, we explore the applicability of Convolution Neural Network (CNN) method for this task. In the evaluation stage, we present 6 bi-class classification experimentations of whale sound detection against different background noise types (e.g., rain, wind). In comparison to classical FFT-based representation like spectrograms, we showed that the use of image-based pretrained CNN features brought higher performance to classify whale sounds and background noise.Comment: arXiv admin note: text overlap with arXiv:1702.02741 by other author

    treeKL: A distance between high dimension empirical distributions

    Get PDF
    This paper offers a methodological contribution for computing the distance between two empirical distributions in an Euclidean space of very large dimension. We propose to use decision trees instead of relying on standard quantification of the feature space. Our contribution is twofold: We first define a new distance between empirical distributions, based on the Kullback-Leibler (KL) divergence between the distributions over the leaves of decision trees built for the two empirical distributions. Then, we propose a new procedure to build these unsupervised trees efficiently. The performance of this new metric is illustrated on image clustering and neuron classification. Results show that the tree-based method outperforms standard methods based on standard bag-of-features procedures. (C) 2012 Elsevier B.V. All rights reserved

    Direct regressions for underwater acoustic source localization in fluctuating oceans

    No full text
    International audienceIn this paper, we show the potential of machine learning regarding the task of underwater source localization through a fluctuating ocean. Underwater source localization is classically addressed under the angle of inversion techniques. However, because an inversion scheme is necessarily based on the knowledge of the environmental parameters, it may be not well adapted to a random and fluctuating underwater channel. Conversely, machine learning only requires using a training database, the environmental characteristics underlying the regression models. This makes machine learning adapted to fluctuating channels. In this paper, we propose to use non linear regressions for source localization in fluctuating oceans. The kernel regression as well as the local linear regression are compared to typical inversion techniques, namely Matched Field Beamforming and the algorithm MUSIC. Our experiments use both real tank-based and simulated data, introduced in the works of Real et al. Based on Monte Carlo iterations, we show that the machine learning approaches may outperform the inversion techniques

    Apprentissage et class ification faiblement supervisée (application en acoustique halieutique)

    No full text
    Cette thèse traite de la classification automatique d'objets dans un cadre d'apprentissage faiblement supervisé. Une application à l'acoustique halieutique est considérée. En classification faiblement supervisée, la connaissance des labels des données d'apprentissage est une connaissance a priori. De manière formelle, chaque objet d'apprentissage est associé à un vecteur dont les composantes donnent les probabilités de classification a priori de l'objet dans chaque classe. Dans ce contexte, nous proposons un modèle génératif, un modèle discriminant, et un modèle basé sur les forêts aléatoires. En outre, un processus itératif est proposé pour modifier les données d'apprentissage afin que des a priori faibles tendent vers des a priori plus certains. Nous fournissons une évaluation quantitative des contributions méthodologiques proposées en fonction de la complexité des situations d'apprentissage faiblement supervisé pour différents jeux de données. Les sondeurs acoustiques sont des outils d'observation in situ des écosystèmes pélagiques (couches de planctons, bancs de poissons, etc). L'analyse et la caractérisation des images acoustiques permettent l'étude des écosystèmes et la préservation des espèces. Dans ce contexte, le nouveau sondeur multifaisceaux donne une vision 3D de la colonne d'eau et une résolution accrue de l'observation des agrégations. Premièrement, nous proposons un nouveau descripteur global des images qui modélise la distribution spatiale des agrégations. Deuxièmement, nous proposons d'appliquer les méthodes de classification faiblement supervisée au cas de l'évaluation de la biomasse des espèces.This thesis deals with object classification and weakly supervised learning. An application to fisheries acoustics is considered. In weakly supervised learning, the training dataset is weakly annotated, i.e. the class knowledge is given by prior. Formally, each training object is associated with vector that provides the prior for each class. In this context, we investigate generative model, discriminative model and a model based on random forest. Furthermore, an iterative procedure is proposed for modifying uncertain priors from low value to more certain value. Experiments are carried out to evaluate classification models as regards to prior complexity. In order to control the prior complexity, weakly supervised dataset are generated from supervised dataset. In fisheries acoustics, fish schools in images are classified, the objective being to study an ecosystem or to assess fish stock biomass. Fish species identification is carried out by trawl catches that provide species prior in a given area. In this context, the new multibeam echosunder provides 3D images. These images are richer and more informative than 2D monobeam echosounder. Firstly, we propose a new global descriptor for characterizing fish school images. The descriptor models both the spatial distribution of fish schools in images and the type of fish schools. Secondly, we propose to apply weakly supervised training schemes to assess fish school biomass in the Bay of Biscay.RENNES1-BU Sciences Philo (352382102) / SudocBREST-Télécom Bretagne (290192306) / SudocSudocFranceF

    Classification and weakly supervised learning in halieutic acoustics

    No full text
    L'apprentissage statistique établit un modèle de classification probabiliste. Dans le cas supervisé, ce modèle est estimé à partir d'un jeu de données labelisées, i.e. à chaque observation correspond un label. Dans le cas faiblement supervisé, le label n'est pas exactement connu. Dans notre cas, seule la probabilité d'associer une observation à une classe est connue. Ainsi à chaque observation correspond un vecteur de probabilité d'affectation aux différentes classes. Les méthodes développées dans cet article sont appliquées à la reconnaissance d'objets dans une image. Nous disposons de plusieurs images contenant des objets à classifier. La vérité terrain pour les images d'apprentissage est la proportion relative des classes dans chaque image. Cette proportion globale donne la probabilité d'affectation de chaque objet de l'image d'apprentissage. L'originalité de ce papier est dans l'association d'un ensemble de données d'apprentissage labelisées en proportion avec un modèle probabiliste de classification basé sur la combinaison de plusieurs modèles discriminants dont la combinaison s'effectue à l'aide d'une technique de Bagging. Deux modèles de classification (l'un Bayésien et l'autre discriminant) sont comparés sur des données provenant de campagnes océanographiques (l'objectif étant de reconnaitre à quelle classe d'espèce est affecté un banc de poissons dans une image, la proportion des classes étant donnée par chalutage). Pour ce jeu de données, le modèle discriminant est plus robuste au nombre de classes présentes dans l'image. L'apport du bagging est mis en évidence pour le modèle discriminant
    corecore